2021年10月17日,智源研究院理事长张宏江博士在清华大学交叉信息学院与“智90班”(2019级清华“智班”)同学们做了主题为《漫话职业规划》的报告与交流。在报告中,他介绍了个人经历,对人工智能研究与投资趋势进行了分析,并把他对职业的思考融入其中。
本文对报告内容进行了不改变原意的整理。
不知同学们是否认得图片中的人物?
从上到下,从左至右依次为Nikola Tesla、Alan Turing、John von Neumann、Claude Shannon、Marvin Minsky、Jim Gray以及Geoffrey Hinton。
大家可能都知晓这些名字,却未必熟悉这些时代开创者的面孔和故事。比如左下角的人工智能的奠基人之一Marvin Minsky,Marvin有个经验:我们该把伟大的思想家内化到自己的头脑里,让他们不断思考,从而帮助自己思考。希望在座的同学们,读一读他们的故事。
Shannon、Turing、John von Neumann,这三位计算机领域的奠基人都是数学家,理论非常强;Tesla则既是一位创新者也是一位企业家,理论与实践结合得非常好。Geoffrey Hinton大家都知道,是2019年的图灵奖的获得者,深度学习的领导者。
我尤其建议同学们读一读Jim Gray的故事,他是我在微软的同事,因为在数据库领域的贡献,1998年获得图灵奖,他既擅长理论亦擅长系统。在今天的计算机领域,尤其中国的计算机领域,非常缺少Jim Gray这种大师级别的程序员——绝不要认为动手能力强是因为理论技术不好;同样也不要觉得理论很强,就可以忽视动手能力——这是我在一开始,就希望同学们谨记的观点。
跟这些大师们相比,我差得太远,但既然站在同学们面前,还是想谈谈自己的经历和体会。我上学那年正好文革开始,11岁就随着父母去了三线,到农村上小学四年级时,一个屋子两个班,老师给一个年级的班布置完作业后,再到另一个年级的班讲课。从小学到高中,我基本上没经历过严格意义上的考试。唯一一次有挑战的考试是高考,我因此成为新中国恢复高考后的第一批大学生。大学毕业以后,我很幸运地到电子部五十四所工作,并很快被推荐到丹麦留学。丹麦是一个小国,在那里的生活非常舒适。我的本科和博士专业都是电子工程,偏系统,博士研究方向是遥感图像处理。但我的兴趣在读博时发生了非常大的转变,我想朝计算机方向发展。在丹麦取得博士学位后,我面临着选择,要么继续在丹麦生活,要么另谋他处转换方向。最终,我毕业后决定去新加坡,我当时拿到了新加坡几个学校的offer,其中一个是新加坡国立大学系统研究所,在那里我转向了计算机。我在新加坡做了三年多的研究,并且在自己的学术研究领域稍微做出了点成绩。之后我进入工业界,加入了硅谷的惠普实验室。在这期间,中国通过十几年的改革开放,取得了瞩目的成就,于是我在1999年决定回国,加入了微软。这里我想强调的是先后顺序,首先我决定回国,然后是选择加入微软。先是看中了大趋势,其次才是平台的选择。在微软工作12年之后,我又加入了金山,担任金山CEO。回顾经历,好像我每一步的点踩得都很好。从1999年到现在,尤其在中国加入WTO以后,是中国经济腾飞的二十年。彼时微软亚洲研究院也开始起飞,中国的教育,中国的平台也在起飞。在这个平台上,我的好运才得以体现——这种好运很大程度上依靠国运。但是,请注意,从博士毕业到微软研究院这期间依然有过许多选择,比如是去新加坡还是留在丹麦,去新加坡后是继续留下去还是再去美国,是选择去学术界还是工业界,是在美国还是在中国……回过头来看,很多人对我说“你回国真是明智”,不过在彼时,很多美国留学生朋友都断言我最多回国一年,还将重返美国。但我在1998年回国几次以后,就看到了国内起兴的征兆。那之后我便开始着手准备。当运气到来,很重要的一点是有选择的能力。然而即使能做出正确的选择,却未必能到好成果。这里的另外一个关键点,在于能否持续苦干——我们不能寄望于运气,如果你没准备好,或者不能持续苦干,机会来了也会错过。当你作出正确的选择,接下来的就是苦干,持续的苦干。考出国,我失败了两次才成功,有了这个经历,我对坚持和苦干的意义有深刻体会。在座的同学都非常聪明,多数人免试入学,还有不少各地状元。然而即使具备如此好的天分,在技术突飞猛进发展时,在选择了自己的事业后,如果不能持续苦干,这个机会仍然可能不属于你。刚才我们提到Geoffrey Hinton。他的学术路程历程非常艰辛——研究生物学出身,早年在英国求学,对神经网络感兴趣之后,就持续地研究和追求。因为这个领域美国做得最好,所以他首先选择去了CMU。CMU以做系统著称,有很多美国国防部和海军研究项目,但由于Hinton的背景,在那里申请研究经费非常困难,所以之后他转往了多伦多大学。但他依然在追求自己的选择,即使是无法获得充裕经费的时候,即使是他的文章还不太受待见的时候,他依然选择持续刻苦努力。另外一个例子是2019年的图灵奖获得者Yann LeCun,他读博士时开始研究神经网络,但他的导师对神经网络并不了解,LeCun只能靠自己探索。另外,他进入这个领域的时间点也不好,当时正好是第二波人工智能浪潮的末尾,人们已经逐渐看到神经网络的局限,开始减少研究经费。他博士毕业后在Hinton那里做博士后,之后也是辗转多地,最后到贝尔实验室才有了充足的经费与计算资源。后来我们看到了,在那里,LeCun继续追寻他的神经网络的梦,发明了卷积神经网络。总的来说,当你选择一件事之后,接下来就要持续苦干,耐得住寂寞,这个逃不掉。以我自己的经历为例,当我来到新加坡决定做视频检索时,我在1993年发表了一篇文章,这是对前面两年工作的总结,这篇文章基本奠定了这个领域的框架。之后我的15年学术生涯,所有工作都沿着这一个方向,从各个角度尝试定义和解决其中的问题,无论是图像分析,人脸识别,相关反馈等。只有这样坚持,持续苦干之后,所做的结果才能够逐渐呈现给同行,被大家接受,成为主流。大部分人所做的扎实的、瞩目的工作,往往是在他不知名时完成的。其实,成名之后的人很容易犯一个错误——只想做非常重要的工作,只想做了不起的题目,于是很容易在不断寻觅了不起的题目的过程中,一个项目也没完成。持续在一个领域耕耘,工作才会有积累,才会逐渐有影响力。很多自信的年轻人把“追寻Passion”挂在嘴边,“这个方向我不喜欢,所以我不做”;“这个职业我不喜欢,我也不做”。但假如问他要做什么,又说不出清晰的答案。我想告诉大家,先forget about your passion,你需要做的第一件事,就是把现在的工作做好,比之前所有人更好。假如每门计算机课程都学不好,却在谈自己的Passion,这样走下去很容易一事无成。我所从事视频检索领域,既有过1990年代的轰轰烈烈,也有过2000年之后的低潮。其中的关键问题,直到深度学习出现后才得到较好的解决。但这并不影响我们所做的推动,也不影响我们在这个领域的贡献。也正是因为这种持续的努力,我们才能搭建起一个领域的框架,不断地发现新的可研究的问题,让后人来用更先进的方法解决问题。当我2005年离开学术界,投身微软工程院时,许多人认为这是简单的产品研发工作,会比在研究院容易许多。但做好这件事,一点也不比研究简单。所以在2010年我获得IEEE“技术成就奖” 后接受人民网采访时,我提到做工程院,做系统,做技术,做产品很大程度上是依靠每件事进取,点点滴滴积累。做大事和做好手头的“小事”不矛盾,持续认真刻苦地去做“小事”是在为“大事”打基础。认真地做小事,或许有更高的概率去发现做“大事”的机会 。接下来我讲讲什么叫研究,研究的内涵是什么,以及怎样做研究。做研究,找定方向最重要,其中包括领域科学的发展方向,工程的发展方向,以及产业的发展方向。三十多年前,我找对了视频检索方向,对我的事业发展助益良多。今天深度学习发展到了哪个阶段,未来方向在何处?深度学习经过十几年的发展,已经进入了依靠大算力、大规模工程化的阶段,所以才产生了GPT-3模型、悟道大模型。同时,对研究者的能力要求与之前也不一样。能否够找到深度学习中的痛点,能否利用大规模的计算能力,利用大规模数据的资源,对这些问题的思考比以往任何时候更重要。今天,大规模智能模型已成为AI技术新范式。第二点是所谓的方法论,我们知道,方法是随着研究本身或者产业发展而改变的。在图灵时代,一个应用数学家只需要做很少的实验,就能验证很多设想。图灵主要是做密码机的研究,实际上是数学问题;John von Neumann是个逻辑数学家,他提出的计算机框架实际上也是个数学问题。而今天的深度神经网络已经不是简单的数学问题。互联网经过二三十年的发展,给我们提供了一个很好的机会,一种新的研究方法——把想法从一开始就放到互联网上,放到开源库里,和大家分享。从一开始就和其他人一起建系统,用数据来验证想法。这就是所谓的Deloyment-Driven Research这种方法是最有效的研究,也是最有效的推广方法。长期从事研究的人都知道,一流高手提问题,很多情况下比解决一个问题更重要。30多年前视频检索、分类领域只有几个人在做,我们实际上就是提出问题的人。尚不能理解语义时,能否分析视频架构、段落形式,是我们当时提的问题。
这个问题提出后,就有一系列学者开始用各自的算法尝试解决。包括一开始视频结构化,后来的相关反馈、自适应内容传递,以及如今被反复提到的Attention Model。我们把这些问题推到同行面前,让大家认识到这些问题的重要。很多人问我怎么投资AI,我会先问他什么叫AI公司?一个AI公司要有能够吸引用户的产品,用户和它交互产生数据,然后用数据改善产品。产品靠AI算法驱动,在这个过程中间不断产生数据,不断改善算法。只有达到这种循环,才是称得上真正的AI的公司,这种循环转不起来,要么卖技术,要么靠咨询。大家知道,咨询公司是做不出高估值的,拿到一单做一单,没有所谓的产品。字节跳动就是成功模式的代表,因而能达到4000亿美元估值。从前人们在搜索引擎寻找信息,而如今有一条新闻或者短视频,则会在用户的空间上寻找谁是最可能的受众,然后通过推荐算法发布——将搜索问题变成了反向搜索问题,将搜索引擎变成了推荐引擎。再看自动驾驶,大家知道有L2-L5不同等级,L5指全自动驾驶,非常困难,但也许大家并没有从经济学的角度思考过是否需要L5?它与L4的重要区别在于关键时刻有控制员介入。今天我们谈起Robo-Taxi,也就是自动驾驶出租车,都将是L4,有人计算,假如每位控制员能够监督1.7辆车,那么自动驾驶出租车的运营成本就会低于今天的出租车公司。到那一天,出租车公司就变成了自动驾驶的公司。当极具便利的低成本L4成为主流,除了钟爱驾驶的人,还会有人会买车吗?L5至少十年以后才能实现,它的未来在何方?而L4四到五年就能落地,所以现在L5想争取投资非常困难。所以分析问题、看本质的能力非常重要。钻研技术,可以追求梦想;但是作为投资、做产业、运营公司则还需要想清楚未来的产业在何方。我们人生很重要的一点,就是要有自己的朋友圈。我有导师、Mentor的朋友圈,早期同行的朋友圈,有多媒体学术领域的朋友圈,有微软研究院的朋友圈。建立朋友圈的目的,不是吃吃喝喝,重要的是彼此交流,获得反馈、支持、信任与合作。合作的秘诀在于具备同理心,消除嫉妒心,这样才能够建立起广泛合作的朋友圈,你需要非常大方的把credit分享给同事,分享给朋友,分享给你的上下级。在交流环节,张宏江博士解答了聆听演讲的同学们提出的问题:Q1:这波人工智能技术的极限预计在哪里?一些人工智能企业的巨额亏损是否反应了AI背后的泡沫?张宏江:这一波人工智能的极限就是深度学习算法和系统的极限,我觉得目前还没有达到。最近一系列新的深度学习模型,包括智源的悟道大模型,去年发布的GPT-3,谷歌发布的BERT模型等,我们还远远没有达到深度学习的极限,还有很长的路要走,无论是在学术上、算法上,还是在系统上、工程上,当然更多是在产品上。至于巨额亏损,有很多原因。很大程度上是商业模式没有定义好,产品的形态没有定义好,业务的发展没有做好。一个公司的成功,当然依赖技术,但技术不是唯一因素,不能成为公司唯一的竞争力。一些AI公司的估值相当高,但没有形成正循环,有泡沫很正常。快速发展的新兴技术,投资泡沫一定存在。我们希望的是泡沫能把好的公司推出来。几年前特斯拉是不是有泡沫?自动驾驶是不是有泡沫?今天中国的新能源车是不是有泡沫?一定有。但不要受这些泡沫干扰,作为一家公司,要想清楚自己的核心竞争力,产品开发路线图,产业发展方向。Q2:有人说,清华的同学,有幸得到了中国最好资源的培养、应该去做一些“大”事——非常难的事,或者正向影响力非常大的事。您如何看待这种观点?张宏江:清华的同学们,任何一个行业都没问题,只要这个行业对社会有利,能够推动技术的发展。当然我想更多的是展开一下:我们要立志去做大事,很重要一点就是要找到能够对我们所在的领域里面有重大影响的工作。但是不要忘了一点:无论将来是从事科研、工程、产品、设计,还是创业,大事都是从小事做起的。尤其是还在学校的时候,我们应该多花点时间,想想怎么能够判断大事,从而去有意识地培养自己的技能,培养自己的判断力。如果能够从众多的小事中看出大趋势,从今天的技术看到明天的技术发展趋势,从今天的商业模式看到未来的商业模式,培养出自己的判断力,判断技术、产品、商业模式、市场的发展,能判断一个技术怎样会影响整个产业,技术怎样能影响其他相关领域的技术,这点我想非常重要。Q3:我们在没有目标的时候往往会做让自己出路最广的选择,比如去读博。但现在有很多人开始说:“读博不适合所有人,没想清楚就不要读。”该怎么做选择?张宏江:读博士完全是个人的选择。今天我们的问题在于要面对周边环境,有太多的世俗压力。很多同学上大学前的成绩非常好,到清华后成绩也很好,然后读博士、博士后。这样一路走来,也许回头才突然发现,好像这不是自己的选择,而是因为自己的学习能力很强,被推到了这个位置上。我建议大家在学习过程中,在自己思考职业发展的过程中,经常要花些时间停下来看一看,到底什么是自己的特长。我们培养的博士人数并不少,甚至可能已经很多超过美国了。我们不妨问一下,这些博士,是不是真正达到了博士的标准?是否能够也成为领域内所研究问题的专家?如果达不到,为什么要读这个博士呢?当然,在计算机、AI领域,读博士是一个很好的选择,因为计算机领域的问题非常多,有很好的问题值得解决。但这一定得是你自己的选择,是你和你的导师,和你的同学,和你能找到的,在这方面能够跟你一起分享思考的人共同讨论的结果,而不应该是随大流,因为世俗的要求去读博,更不应该是仅仅为了拿一个学位而去读博。读博士未必适合每个人。不适合读博士的人,未必是IQ有问题,或者是学习成绩有问题。有些人的热情就在于在实际的工作中解决实际的问题,这点我觉得没有任何问题,这是他自己的选择。而且,我们社会也需要更多的像各位一样有资质的工程师。如果没有大量的工程师作为AI发展的中坚力量,技术也无法向前发展。在交流最后,张宏江博士对在场的学子们提出了自己的期待:
张宏江:今天我看到了许许多多自信的年轻面庞,我更想看到各位未来能够成为各自领域的极客。我所说的“极客”是什么?他们有情怀、有能力、阳光开放。情怀很重要,开源软件运动就是一批有情怀的人从事的伟大事业;这样的极客还要有编程、架构、产品、研究、找方向、看本质的能力;阳光和开放连在一起的,开放的心态是如此的重要,如果没有开放的心态,我们就不可能有Linux、开源数据库,不可能有中国二十多年的经济成就。作为个人,就不可能有自己的朋友圈。在座的各位都是佼佼者,不仅仅是高中同学中的佼佼者,也是清华的佼佼者,希望你们未来脚踏实地,立大志,从小事做起,追求极致。